Oracle分析函数first_value()和last_value()的用法及原理

作者：手机用户2502856895 | 来源：互联网 | 2023-12-13 19:07

本文介绍了Oracle分析函数first_value()和last_value()的用法和原理，以及在查询销售记录日期和部门中的应用。通过示例和解释，详细说明了first_value()和last_value()的功能和不同之处。同时，对于last_value()的结果出现不一样的情况进行了解释，并提供了理解last_value()默认统计范围的方法。该文对于使用Oracle分析函数的开发人员和数据库管理员具有参考价值。

篇首语：本文由编程笔记#小编为大家整理，主要介绍了Oracle分析函数-first_value()和last_value()相关的知识，希望对你有一定的参考价值。

first_value()和last_value()字面意思已经很直观了&＃xff0c;取首尾记录值。
例:查询部门最早发生销售记录日期和最近发生的销售记录日期

看结果first_value()很直观&＃xff0c;不用多解释
但是&＃xff0c;last_value()值&＃xff0c;部门D01不是应该为2014/6/12&＃xff0c;部门D02不是应该为2014/5/2吗?为什么会每条记录都不一样?
可以这样去理解:last_value()默认统计范围是 rows between unbounded preceding and current row
验证一下:

select dept_id ,sale_date ,goods_type ,sale_cnt ,first_value(sale_date) over (partition by dept_id order by sale_date) first_value ,last_value(sale_date) over (partition by dept_id order by sale_date desc) last_value ,last_value(sale_date) over (partition by dept_id order by sale_date rows between unbounded preceding and unbounded following) last_value_all from criss_sales;

全统计的情况下得到的last_value()值&＃xff0c;部门D01为2014/6/12&＃xff0c;部门D02为2014/5/2。

Oracle开发之&＃xff1a;窗口函数 &＃xff08;转&＃xff09; `rows between unbounded preceding and current row`

一、窗口函数简介&＃xff1a;

到目前为止&＃xff0c;我们所学习的分析函数在计算/统计一段时间内的数据时特别有用&＃xff0c;但是假如计算/统计需要随着遍历记录集的每一条记录而进行呢&＃xff1f;举些例子来说&＃xff1a;

①列出每月的订单总额以及全年的订单总额
②列出每月的订单总额以及截至到当前月的订单总额
③列出上个月、当月、下一月的订单总额以及全年的订单总额
④列出每天的营业额及一周来的总营业额
⑤列出每天的营业额及一周来每天的平均营业额

仔细回顾一下前面我们介绍到的分析函数&＃xff0c;我们会发现这些需求和前面有一些不同&＃xff1a;前面我们介绍的分析函数用于计算/统计一个明确的阶段/记录集&＃xff0c;而这里有部分需求例如2&＃xff0c;需要随着遍历记录集的每一条记录的同时进行统计。

也即是说&＃xff1a;统计不止发生一次&＃xff0c;而是发生多次。统计不至发生在记录集形成后&＃xff0c;而是发生在记录集形成的过程中。

这就是我们这次要介绍的窗口函数的应用了。它适用于以下几个场合&＃xff1a;

①通过指定一批记录&＃xff1a;例如从当前记录开始直至某个部分的最后一条记录结束
②通过指定一个时间间隔&＃xff1a;例如在交易日之前的前30天
③通过指定一个范围值&＃xff1a;例如所有占到当前交易量总额5%的记录

二、窗口函数示例&＃xff0d;全统计&＃xff1a;

下面我们以需求&＃xff1a;列出每月的订单总额以及全年的订单总额为例&＃xff0c;来看看窗口函数的应用。

【1】测试环境&＃xff1a;

SQL> desc orders; 名称是否为空? 类型 ----------------------- -------- ---------------- MONTH NUMBER(2) TOT_SALES NUMBER SQL>

【2】测试数据&＃xff1a;

SQL> select * from orders; MONTH TOT_SALES ---------- ---------- 1 610697 2 428676 3 637031 4 541146 5 592935 6 501485 7 606914 8 460520 9 392898 10 510117 11 532889 12 492458 已选择12行。

【3】测试语句&＃xff1a;

回忆一下前面《Oracle开发专题之&＃xff1a;分析函数(OVER)》一文中&＃xff0c;我们使用了sum(sum(tot_sales)) over (partition by region_id) 来统计每个分区的订单总额。现在我们要统计的不单是每个分区&＃xff0c;而是所有分区&＃xff0c;partition by region_id在这里不起作用了。

Oracle为这种情况提供了一个子句&＃xff1a;rows between ... preceding and ... following。从字面上猜测它的意思是&＃xff1a;在XXX之前和XXX之后的所有记录&＃xff0c;实际情况如何让我们通过示例来验证&＃xff1a;

SQL> select month, 2 sum(tot_sales) month_sales, 3 sum(sum(tot_sales)) over (order by month 4 rows between unbounded preceding and unbounded following) total_sales 5 from orders 6 group by month; MONTH MONTH_SALES TOTAL_SALES ---------- ----------- ----------- 1 610697 6307766 2 428676 6307766 3 637031 6307766 4 541146 6307766 5 592935 6307766 6 501485 6307766 7 606914 6307766 8 460520 6307766 9 392898 6307766 10 510117 6307766 11 532889 6307766 12 492458 6307766 已选择12行。

绿色高亮处的代码在这里发挥了关键作用&＃xff0c;它告诉oracle统计从第一条记录开始至最后一条记录的每月销售额。这个统计在记录集形成的过程中执行了12次&＃xff0c;这时相当费时的&＃xff01;但至少我们解决了问题。

unbounded preceding and unbouned following的意思针对当前所有记录的前一条、后一条记录&＃xff0c;也就是表中的所有记录。那么假如我们直接指定从第一条记录开始直至末尾呢&＃xff1f;看看下面的结果&＃xff1a;

SQL> select month, 2 sum(tot_sales) month_sales, 3 sum(sum(tot_sales)) over (order by month 4 rows between 1 preceding and unbounded following) all_sales 5 from orders 6 group by month; MONTH MONTH_SALES ALL_SALES ---------- ----------- ---------- 1 610697 6307766 2 428676 6307766 3 637031 5697069 4 541146 5268393 5 592935 4631362 6 501485 4090216 7 606914 3497281 8 460520 2995796 9 392898 2388882 10 510117 1928362 11 532889 1535464 12 492458 1025347 已选择12行。

很明显这个语句错了。实际1在这里不是从第1条记录开始的意思&＃xff0c;而是指当前记录的前一条记录。preceding前面的修饰符是告诉窗口函数执行时参考的记录数&＃xff0c;如同unbounded就是告诉oracle不管当前记录是第几条&＃xff0c;只要前面有多少条记录&＃xff0c;都列入统计的范围。

三、窗口函数进阶&＃xff0d;滚动统计(累积/均值)&＃xff1a;

考虑前面提到的第2个需求&＃xff1a;列出每月的订单总额以及截至到当前月的订单总额。也就是说2月份的记录要显示当月的订单总额和1,2月份订单总额的和。3月份要显示当月的订单总额和1,2,3月份订单总额的和&＃xff0c;依此类推。

很明显这个需求需要在统计第N月的订单总额时&＃xff0c;还要再统计这N个月来的订单总额之和。想想上面的语句&＃xff0c;假如我们能够把and unbounded following换成代表当前月份的逻辑多好啊&＃xff01;很幸运的是Oracle考虑到了我们这个需求&＃xff0c;为此我们只需要将语句稍微改成: curreent row就可以了。

SQL> select month, 2 sum(tot_sales) month_sales, 3 sum(sum(tot_sales)) over(order by month 4 rows between unbounded preceding and current row) current_total_sales 5 from orders 6 group by month; MONTH MONTH_SALES CURRENT_TOTAL_SALES ---------- ----------- ------------------- 1 610697 610697 2 428676 1039373 3 637031 1676404 4 541146 2217550 5 592935 2810485 6 501485 3311970 7 606914 3918884 8 460520 4379404 9 392898 4772302 10 510117 5282419 11 532889 5815308 12 492458 6307766 已选择12行。

现在我们能得到滚动的销售总额了&＃xff01;下面这个统计结果看起来更加完美&＃xff0c;它展现了所有我们需要的数据&＃xff1a;

SQL> select month, 2 sum(tot_sales) month_sales, 3 sum(sum(tot_sales)) over(order by month 4 rows between unbounded preceding and current row) current_total_sales, 5 sum(sum(tot_sales)) over(order by month 6 rows between unbounded preceding and unbounded following) total_sales 7 from orders 8 group by month; MONTH MONTH_SALES CURRENT_TOTAL_SALES TOTAL_SALES ---------- ----------- ------------------- ----------- 1 610697 610697 6307766 2 428676 1039373 6307766 3 637031 1676404 6307766 4 541146 2217550 6307766 5 592935 2810485 6307766 6 501485 3311970 6307766 7 606914 3918884 6307766 8 460520 4379404 6307766 9 392898 4772302 6307766 10 510117 5282419 6307766 11 532889 5815308 6307766 12 492458 6307766 6307766 已选择12行。

在一些销售报表中我们会时常看到求平均值的需求&＃xff0c;有时可能是针对全年的数据求平均值&＃xff0c;有时会是针对截至到当前的所有数据求平均值。很简单&＃xff0c;只需要将&＃xff1a;
sum(sum(tot_sales))换成avg(sum(tot_sales))即可。

四、窗口函数进阶&＃xff0d;根据时间范围统计&＃xff1a;

前面我们说过&＃xff0c;窗口函数不单适用于指定记录集进行统计&＃xff0c;而且也能适用于指定范围进行统计的情况&＃xff0c;例如下面这个SQL语句就统计了当天销售额和五天内的评价销售额&＃xff1a;

select trunc(order_dt) day, sum(sale_price) daily_sales, avg(sum(sale_price)) over (order by trunc(order_dt) range between interval &＃39;2&＃39; day preceding and interval &＃39;2&＃39; day following) five_day_avg from cust_order where sale_price is not null and order_dt between to_date(&＃39;01-jul-2001&＃39;,&＃39;dd-mon-yyyy&＃39;) and to_date(&＃39;31-jul-2001&＃39;,&＃39;dd-mon-yyyy&＃39;)

为了对指定范围进行统计&＃xff0c;Oracle使用关键字range、interval来指定一个范围。上面的例子告诉Oracle查找当前日期的前2天&＃xff0c;后2天范围内的记录&＃xff0c;并统计其销售平均值。

五、窗口函数进阶&＃xff0d;`first_value/last_value`&＃xff1a;

Oracle提供了2个额外的函数&＃xff1a;first_value、last_value&＃xff0c;用于在窗口记录集中查找第一条记录和最后一条记录。假设我们的报表需要显示当前月、上一个月、后一个月的销售情况&＃xff0c;以及每3个月的销售平均值&＃xff0c;这两个函数就可以派上用场了。

select month, first_value(sum(tot_sales)) over (order by month rows between 1 preceding and 1 following) prev_month, sum(tot_sales) monthly_sales, last_value(sum(tot_sales)) over (order by month rows between 1 preceding and 1 following) next_month, avg(sum(tot_sales)) over (order by month rows between 1 preceding and 1 following) rolling_avg from orders where year &＃61; 2001 and region_id &＃61; 6 group by month order by month;

首先我们来看:rows between 1 preceding and 1 following告诉Oracle在当前记录的前一条、后一条范围内查找并统计&＃xff0c;而first_value和last_value在这3条记录中至分别找出第一条、第三条记录&＃xff0c;这样我们就轻松地得到相邻三个月的销售记录及平均值了&＃xff01;

六、窗口函数进阶&＃xff0d;比较相邻记录&＃xff1a;

通过第五部分的学习&＃xff0c;我们知道了如何利用窗口函数来显示相邻的记录&＃xff0c;现在假如我们想每次显示当月的销售额和上个月的销售额&＃xff0c;应该怎么做呢&＃xff1f;

从第五部分的介绍我们可以知道&＃xff0c;利用first_value(sum(tot_sales) over (order by month rows between 1 preceding and 0 following))就可以做到了&＃xff0c;其实Oracle还有一个更简单的方式让我们来比较2条记录&＃xff0c;它就是lag函数。

leg函数类似于preceding和following

子句&＃xff0c;它能够通过和当前记录的相对位置而被应用&＃xff0c;在比较同一个相邻的记录集内两条相邻记录的时候特别有用。

select month, sum(tot_sales) monthly_sales, lag(sum(tot_sales), 1) over (order by month) prev_month_sales from orders where year &＃61; 2001 and region_id &＃61; 6 group by month order by month;

lag(sum(tot_sales),1)中的1表示以1月为基准。

推荐阅读

join
MySQL索引详解与优化

本文深入探讨了MySQL中的索引机制，包括索引的基本概念、优势与劣势、分类及其实现原理，并详细介绍了索引的使用场景和优化技巧。通过具体示例，帮助读者更好地理解和应用索引以提升数据库性能。 ... [详细]

蜡笔小新 2024-12-25 19:52:47
php
深入理解 SQL 视图、存储过程与事务

本文详细介绍了SQL中的视图、存储过程和事务的概念及应用。视图为用户提供了一种灵活的数据查询方式，存储过程则封装了复杂的SQL逻辑，而事务确保了数据库操作的完整性和一致性。 ... [详细]

蜡笔小新 2024-12-27 17:40:42
foreach
PHP 编程疑难解析与知识点汇总

本文详细解答了 PHP 编程中的常见问题，并提供了丰富的代码示例和解决方案，帮助开发者更好地理解和应用 PHP 知识。 ... [详细]

蜡笔小新 2024-12-28 12:22:34
instance
新浪笔试题

1:有如下一段程序：packagea.b.c;publicclassTest{privatestaticinti0;publicintgetNext(){return ... [详细]

蜡笔小新 2024-12-27 19:32:17
foreach
MyBatis 动态 SQL 详解与应用

本文深入探讨 MyBatis 中动态 SQL 的使用方法，包括 if/where、trim 自定义字符串截取规则、choose 分支选择、封装查询和修改条件的 where/set 标签、批量处理的 foreach 标签以及内置参数和 bind 的用法。 ... [详细]

蜡笔小新 2024-12-27 16:20:10
foreach
Akka BackoffSupervisor的深入解析与实践

本文详细介绍了Akka中的BackoffSupervisor机制，探讨其在处理持久化失败和Actor重启时的应用。通过具体示例，展示了如何配置和使用BackoffSupervisor以实现更细粒度的异常处理。 ... [详细]

蜡笔小新 2024-12-27 15:04:09
jsp
使用 NSTimer 实现倒计时功能

本文介绍如何使用 NSTimer 实现倒计时功能，详细讲解了初始化方法、参数配置以及具体实现步骤。通过示例代码展示如何创建和管理定时器，确保在指定时间间隔内执行特定任务。 ... [详细]

蜡笔小新 2024-12-26 19:08:19
php
macOS系统及其关键功能解析

本文详细介绍了macOS系统的核心组件，包括如何管理其安全特性——系统完整性保护（SIP），并探讨了不同版本的更新亮点。对于使用macOS系统的用户来说，了解这些信息有助于更好地管理和优化系统性能。 ... [详细]

蜡笔小新 2024-12-26 18:05:04
select
SQL 触发器实现视图插入操作

本文介绍如何通过创建替代插入触发器，使对视图的插入操作能够正确更新相关的基本表。涉及的表包括：飞机（Aircraft）、员工（Employee）和认证（Certification）。 ... [详细]

蜡笔小新 2024-12-26 15:53:40
join
技术分享：从动态网站提取站点密钥的解决方案

本文探讨了如何从动态网站中提取站点密钥，特别是针对验证码（reCAPTCHA）的处理方法。通过结合Selenium和requests库，提供了详细的代码示例和优化建议。 ... [详细]

蜡笔小新 2024-12-28 04:11:47
heap
C++实现经典排序算法

本文详细介绍了七种经典的排序算法及其性能分析。每种算法的平均、最坏和最好情况的时间复杂度、辅助空间需求以及稳定性都被列出，帮助读者全面了解这些排序方法的特点。 ... [详细]

蜡笔小新 2024-12-27 19:25:14
php
Dockerfile 编写与 Docker 网络配置详解

本文详细介绍了 Dockerfile 的编写方法及其在网络配置中的应用，涵盖基础指令、镜像构建与发布流程，并深入探讨了 Docker 的默认网络、容器互联及自定义网络的实现。 ... [详细]

蜡笔小新 2024-12-27 17:31:41
list
数据库内核开发入门 | 搭建研发环境的初步指南

本课程将带你从零开始，逐步掌握数据库内核开发的基础知识和实践技能，重点介绍如何搭建OceanBase的开发环境。 ... [详细]

蜡笔小新 2024-12-27 16:38:48
foreach
深入解析 MVC 源码：ParameterDescriptor 与 Action 方法参数绑定

在前两篇文章中，我们探讨了 ControllerDescriptor 和 ActionDescriptor 这两个描述对象，分别对应控制器和操作方法。本文将基于 MVC3 源码进一步分析 ParameterDescriptor，即用于描述 Action 方法参数的对象，并详细介绍其工作原理。 ... [详细]

蜡笔小新 2024-12-27 15:26:10
php
MySQL 数据库迁移指南：从本地到远程及磁盘间迁移

本文详细介绍了如何在不同场景下进行 MySQL 数据库的迁移，包括从一个硬盘迁移到另一个硬盘、从一台计算机迁移到另一台计算机，以及解决迁移过程中可能遇到的问题。 ... [详细]

蜡笔小新 2024-12-26 13:21:38